前言:
- UDP 和 TCP 及 socket 介绍;
- 网络七层协议(四/五层模型);
- IP 地址与端口;
- Python3 编码转换;
- Socket 套接字;
- UDP 协议;
- TCP 协议。
Python 网络通信
一、UDP 和 TCP 及 socket 介绍
注意:udp 和 tcp 都是网络传输的协议,只不过具体传输形式不一样,但功能都是定义网络传输数据规则。
udp 和 tcp (发短信和打电话)(不同: 是否创建链接)
udp 是用户数据报协议,UDP(User Datagram Protocol)不能保证数据的准确性和有效性。
(数据报:是通过网络传输的数据的基本单元)tcp 是传输控制协议,TCP(Transmission Control Protocol)能保证数据的准确性和有效性。
(和udp差不多依靠socket技术)socket 就是具体实现 tcp 和 udp 的底层技术(也称套接字/流对象)(不在网络七层协议之列-因为是技术不是协议)
二、网络七层协议(四/五层模型)
三、IP 地址与端口
网络通信过程中,之所需要ip、port等,就是为了能够将一个复杂的通信过程进行任务划分,从而保证数据准确无误的传递。
ip 地址
作用:用来在网络中标记一台电脑,比如 192.168.1.1 在本地局域网上是唯一的。
注意:IP 地址 127.0.0.1~127.255.255.255 用于回路测试
端口
端口是通过端口号来标记的,端口号只有整数,范围是从0到65535
知名端口
众所周知的端口号,范围从0到1023
80 端口分配给HTTP服务 |
动态端口
范围是从1024到65535
查看端口
netstat -an 查看端口状态 |
四、Python3 编码转换
str->bytes:encode编码
bytes->str:decode解码
# encoding: 在解码编码过程中使用的编码(此处指“编码方案”是名词) |
详细的可以参照官方文档:
五、Socket 套接字
socket(简称 套接字也成为插口–流对象) 是进程间通信的一种方式,它与其他进程间通信的一个主要不同是:
它能实现不同主机间的进程间通信,我们网络上各种各样的服务大多都是基于 Socket 来完成通信的。
例如我们每天浏览网页、QQ 聊天、收发 email 等等。
Socket 反问理解
———start———
what 是什么?(概念、理解)
socket(简称 套接字 也称为插口–流对象) 是进程间通信的一种方式
why 为什么用?(用它的好处,特点/不同点)
是实现tcp和udp的底层技术,能实现 不同主机间 的进程间通信
where 在哪使用?(案例、项目)
网络程序发送、接收数据(发短信、打电话、广播)
————end————
六、UDP 协议
udp 是用户数据报协议,UDP (User Datagram Protocol) 不能保证数据的准确性和有效性。 (数据报:是通过网络传输的数据的基本单元)
udp 通信模型中,在通信开始之前,不需要建立相关的链接,只需要发送数据即可,类似于生活中,”写信/发短信”
python 使用 udp 协议要通过 socket 技术:
使用步骤:1.引包 2.创建流对象(ipv4, udp) 3.发送(二进制字符串, 元组ip和端口) 4.关闭流对象
创建 socket 语法
# Address Family:可以选择 AF_INET(用于 Internet 进程间通信) 或者 AF_UNIX(用于同一台机器进程间通信),实际工作中常用AF_INET |
案例
1.udp 发送
# 1.引包 |
2.udp 接收(主动接收方需手动绑定端口,发送方才知道发送给谁)
import socket |
3.udp 聊天器
""" |
七、TCP 协议
TCP协议,传输控制协议(英语:Transmission Control Protocol,缩写为 TCP)是一种面向连接的、可靠的、基于字节流的传输层通信协议,由 IETF 的 RFC 793 定义。
TCP通信需要经过 创建连接、数据传送、终止连接 三个步骤。
TCP通信模型中,在通信开始之前,一定要先建立相关的链接,才能发送数据,类似于生活中,”打电话””
TCP 特点
1.面向连接
- 通信双方必须先建立连接才能进行数据的传输,双方都必须为该连接分配必要的系统内核资源,以管理连接的状态和连接上的传输。
- TCP不适用于广播的应用程序,基于广播的应用程序请使用UDP协议。
2.可靠传输
- TCP采用发送应答机制
- TCP发送的每个报文段都必须得到接收方的应答才认为这个TCP报文段传输成功
- 超时重传
- 发送端发出一个报文段之后就启动定时器,如果在定时时间内没有收到应答就重新发送这个报文段。
- TCP为了保证不发生丢包,就给每个包一个序号,同时序号也保证了传送到接收端实体的包的按序接收。然后接收端实体对已成功收到的包发回一个相应的确认(ACK);如果发送端实体在合理的往返时延(RTT)内未收到确认,那么对应的数据包就被假设为已丢失将会被进行重传。
- 错误校验
- TCP用一个校验和函数来检验数据是否有错误;在发送和接收时都要计算校验和。
- 流量控制和阻塞管理
- 流量控制用来避免主机发送得过快而使接收方来不及完全收下。
tcp 注意点
- tcp服务器一般情况下都需要绑定ip和端口,否则客户端找不到这个服务器及其服务对应的端口
- tcp客户端一般不绑定,因为是主动链接服务器,所以只要确定好服务器的ip、port等信息就好,本地客户端可以随机
- tcp服务器中通过listen可以将socket创建出来的主动套接字变为被动的,这是做tcp服务器时必须要做的
- 当客户端需要链接服务器时,就需要使用connect进行链接,udp是不需要链接的而是直接发送,但是tcp必须先链接,只有链接成功才能通信
- 当一个tcp客户端连接服务器时,服务器端会有1个新的套接字,这个套接字用来标记这个客户端,单独为这个客户端服务
- listen后的套接字是被动套接字,用来接收新的客户端的链接请求的,而accept返回的新套接字是标记这个新客户端的
- 关闭listen后的套接字意味着被动套接字关闭了,会导致新的客户端不能够链接服务器,但是之前已经链接成功的客户端正常通信。
- 关闭accept返回的套接字意味着这个客户端已经服务完毕
- 当客户端的套接字调用close后,服务器端会recv解堵塞,并且返回的长度为0,因此服务器可以通过返回数据的长度来区别客户端是否已经下线
- 空字符串能够直接发送不能够直接接收(tcp服务端会过滤)
tcp 三次握手和四次挥手
tcp 三次握手图解
标志位 | 序号 |
---|---|
SYN: 表示连接请求 | seq:表示报文序号 |
ACK: 表示确认 | ack: 表示确认号 |
FIN: 表示关闭连接 |
(1)第一次握手:Client将标志位SYN置为1,随机产生一个值seq=J,并将该数据包发送给Server,Client进入SYN_SENT状态,等待Server确认。 |
tcp 四次挥手图解
客户端主动关闭(三次挥手): |
案例
1.tcp 客户端
from socket import * |
2.tcp 服务端
|
八、TCP 与 UDP 的不同点
TCP:
- 面向连接(确认有创建三方交握,连接已创建才作传输。)
- 有序数据传输
- 重发丢失的数据包
- 舍弃重复的数据包
- 无差错的数据传输
- 阻塞/流量控制
UDP 通信模型(类似于写信/发短信/广播/视频聊天)
TCP 通信模型(类似于打电话)